Extracción de plan autoguiado para tareas de seguimiento de instrucciones con aprendizaje reforzado condicional al objetivo
Optimiza el seguimiento de instrucciones con aprendizaje reforzado a través de la extracción de un plan autoguiado en este estudio innovador.